Évaluer Et Améliorer Une Ressource Distributionnelle : Protocole D'annotation De Liens Sémantiques En Contexte
نویسندگان
چکیده
Using distributional analysis methods to compute semantic proximity links between words has become commonplace in NLP. This paper focuses on the issues of evaluating a distributional resource. We consider that setting up an evaluation procedure is a first step towards the characterization of the resource, and a way to improve its overall quality. We then propose a new protocol for in-text annotation of distributional neighbors, which is used to build a reliable reference data set. The data generated are analyzed and used to guide the automatic categorization of distributional links. MOTS-CLÉS : Analyse distributionnelle, ressources lexicales, évaluation.
منابع مشابه
Lexical access via a simple co-occurrence network (Trouver les mots dans un simple réseau de co-occurrences) [in French]
Au cours des deux dernières décennies des psychologues et des linguistes informaticiens ont essayé de modéliser l'accès lexical en construisant des simulations ou des ressources. Cependant, parmi ces chercheurs, pratiquement personne n'a vraiment cherché à améliorer la navigation dans des 'dictionnaires électroniques destinés aux producteurs de langue'. Pourtant, beaucoup de travaux ont été con...
متن کاملUne nouvelle mesure sémantique pour le calcul de la similarité entre deux concepts d'une même ontologie
Résumé. Les ontologies sont au coeur du processus de gestion des connaissances. Différentes mesures sémantiques ont été proposées dans la littérature pour évaluer quantitativement l’importance de la liaison sémantique entre paires de concepts. Cet article propose une synthèse analytique des principales mesures sémantiques basées sur une ontologie modélisée par un graphe et restreinte ici aux li...
متن کاملExploitation des Liens Sémantiques pour l'Expansion de Requêtes dans un Système de Recherche d'Information
RÉSUMÉ: Dans cet article, nous proposons d’exploiter des liens sémantiques entre concepts pour améliorer la recherche d’information. Un thesaurus électronique de langue générale est utilisé pour la reformulation des requêtes utilisateurs en procédant par un processus d’"expansion prudente" en amont d’un moteur de recherche. Ce processus, transparent à l’utilisateur, exploite d’abord la notion d...
متن کاملUne plateforme de développement d'espaces webs sémantiques communautaires dédiés au partage de ressources multimédia
Résumé. OSIRIS (Ontology-based Systems for Semantic Information Retrieval and Indexation dedicated to communautary and open web Spaces) est un outil dédié au développement d’espaces web communautaires permettant l’annotation et la recherche sémantique de ressources multimédia partagées. Fondé sur l’utilisation d’ontologies denses associées à des thésaurii, OSIRIS permet de décrire sémantiquemen...
متن کاملIntégration de données hétérogènes basée sur la qualité
RÉSUMÉ. Les systèmes de médiation constituent une réponse architecturale pour un accès transparent à des sources de données distribuées. Cependant, leur mise en oeuvre pose un certain nombre de problèmes, tant en ce qui concerne la génération des liens sémantiques entre le schéma de médiation et les sources de données (requêtes de médiation) qu'en ce qui concerne l'adaptation de l'accès aux bes...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- TAL
دوره 54 شماره
صفحات -
تاریخ انتشار 2013